分享:
作者:国工智能实施团队—曹静
前言
科技横飞的时代,大部分实验室管理系统(LIMS)都拥有数十上百的分析仪器设备,一台仪器检测数十个项目,实验室的温度、湿度、压强与实验结果的相关性越来越受人们的关注。国工智能实验室管理系统融合了国工智能数据大脑平台,平台内提供上百中统计学相关算法及机器学习算法,对实验室的数据进行分析、挖掘,提高企业产品附加值及行业竞争力。本次案例就因子分析与实验室LIMS系统相融合进行探讨及应用举例。
含义
因子分析是指根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构—即公共因子。使用因子分析可通过评估变量之间的相关来评估数据的结构,使用此分析可以将每个原始变量建模为这些底层因子的线性函数。
案例
某企业LIMS实验室想了解温度、湿度、压强、实验结果这四个因子之间的相关性,在不同的温度、湿度、压强下对同一个样品进行测试,得到7次实验结果如表1所示,试分析不同的温度、湿度、压强、实验结果的相关性大小。
温度 |
湿度 |
压强 |
实验结果 |
20 |
58 |
70 |
40.32 |
22 |
54 |
75 |
39.16 |
24 |
50 |
80 |
37.25 |
26 |
46 |
85 |
36.01 |
28 |
44 |
90 |
34.74 |
30 |
40 |
95 |
34.03 |
32 |
36 |
100 |
33.89 |
表1 不同温度、湿度、压强得到的实验结果
要验证温度、湿度、压强、实验结果这四个因子之间是否存在相关性及相关性大小,因此可以采用因子分析进行检验。
分析过程
使用国工数据大脑组件对国工实验室系统数据进行读取,直接访问数据库获取数据集。
图1 RDBMS读取组件
使用集成好算法的因子分析组件进行数据的因子分析处理,对组件参数进行设置,变量字段配置为温度、湿度、压强、实验结果,因为共有4个变量,所以要提取的因子数配置为2,单击运行,从调试面板中查看分析结果。
图2 因子分析组件及参数配置
图3 结果分析
检查载荷模式,以确定对每个变量影响最强的因子。接近于-1或1的载荷表明因子对变量的影响非常强。接近0的载荷表明因子对变量的影响很弱。有些变量可能对多个因子施加高载荷。
非旋转因子载荷通常很难解释,因子旋转简化了载荷结构,并且使因子载荷更容易解释。使用旋转的因子载荷,可以得出如下结论:
湿度(0.998)和结果值(0.986)在因子1上具有较大的正载荷,温度(0.999)、湿度(0.998)、压强(0.999)和结果值(1)在因子3上具有较大的正载荷,所以这两个因子共同解释数据变异的0.999或99.9%。
与LIMS系统相融合
国工数据大脑平台可直接获取实验室LIMS系统中的实验数据,直接将实验数据对接到创建好的因子分析模型中,根据得出的结果分析温度、湿度、压强、实验结果在因子1和因子2的相关性。
参数说明
因子载荷:表示因子对变量的解释程度。载荷范围可以为-1到1,国工数据大脑因子分析组件会计算非旋转因子载荷和旋转因子载荷。
变量:分析研究对象的变量。
要提取的因子数:因子数必须至少为1且不得超过总变量数,为了取得最佳结构,数据中的每3个变量拥有的因子不得超过一个。例如,有12个变量,则最多提前4个因子。
方差贡献率:使用方差贡献率(%Var)可确定因子解释的方差量。保留解释可接受方差水平的因子。
方差(特征值):如果使用主分量提供因子,则方差等于特征值。可使用特征值的大小确定因子数。保留具有最大特征值的因子。
适用范围
不同的变量选择因子数之后,分析因子对变量的是否有影响。
精馏回收工艺是医药化工行业中的最为重要的典型单元操作之一,在原料药、精细化工、轻工业等各个领域都有极其广泛的应用。由于精馏过程的复杂性,精馏工艺过程的终点现阶段仍需要生产工人每隔一定时间取样送实验室检测,通过气相色谱测定含量,卡尔费休滴定法
中秋节是中国传统节日之一,也是一年中最重要、最盛大的节日之一。在这一天,以明亮的月亮和家人团聚为特点,承载着人们无尽的思念和美好的祝福。 国庆、中秋两节遇, 合家团圆精神俱。 团团圆圆过中秋, 欢欢喜喜
2023年8月28日,国工智能与镁伽科技举行战略合作签约仪式,国工智能董事长柳彦宏与镁伽科技创始人兼首席执行官黄瑜清先生代表双方签订正式战略合作协议,标志着AI辅助化工研发领先者、智能自动化实验室引领者开启强强联合发展之路。&n
创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力,也是中华民族最深沉的民族禀赋。在激烈的国际竞争中,惟创新者进,惟创新者强,惟创新者胜。 5月27日